#imitación eficiente

Autoimitación Temporal: Aprendizaje por Refuerzo Eficiente

Descubre cómo Temporal Self-Imitation Learning (TSIL) optimiza tareas robóticas de largo horizonte usando la eficiencia temporal como señal de supervisión.

2026-06-19 · 2 min